人工智能最近大热,网络上也突然多了很多人工智能的评论家。作为法律从业者,我一直很关心人工智能在法律界的发展情况,经常会看到“机器人将要取代律师”之类的报道,媒体甚至勾画出机器人律师回答客户问题、审核、撰写合同的场景,如同科幻片。这些机器人律师到底怎么工作,效果如何?相关报道都语焉不详。套用一句俗语,河神要娶媳妇,至少得让河神现身让人瞅瞅吧。本文的目的在于调查市场上的机器人律师,分析它们的工作原理和效果,让读者自己判断到底能不能代替律师,发展到了什么程度?
一、机器人律师是如何工作的?原理是什么?
在网络上检索一下你会发现,现在号称人工智能律师的软件可真不少,从法律研究、档案管理、合同审核、撰写的应有尽有,档案管理主要根据档案的关键词类型进行分类,撰写审核主要是自动审核合同中的明显错误,或者根据关键词检索一份类似的合同模板改编等,这些系统是不是真正的人工智能还有待商榷,选择一个代表性的,ROSS intelligence,ROSS是基于IBM公司的人工智能系统Watson开发的法律服务系统,无疑是采用真正的人工智能技术的。Watson是IBM的一款机器问答系统,因参加美国的一档问答电视节目“jeopardy”拿到最高奖而闻名全球,在该节目中,Watson能阅读屏幕上的问题,计算出答案,然后按下按钮进行抢答,用自然语言回答问题的答案。
那么ROSS intelligence是如何工作的呢?
ROSS其实是一款智能法律检索系统。案例研究是律师工作的一个重要部分,遇到新的案件,律师都需要在法律数据中检索过往类似的案件,参考法官的判决情况,这些工作通常也由律师助理来完成。传统的法律检索平台例如Westlaw提供两种检索方式,分别是布尔逻辑和自然语言检索,布尔逻辑检索就用and,or连接一个检索式,自然语言检索则是直接用自然语言输入想要查询的内容,比如我们查询如下的信息?
“梅西和他的父亲豪尔赫被认为存在偷漏税行为,在2007年、2008年和2009年三年合计逃税410万欧元。虽然梅西补缴了部分税款,并且直言自己的事情都是交给父亲和经纪团队打理,自己对很多事情毫不知情,梅西犯了什么罪?会遭到什么处罚。”
用传统的布尔逻辑检索,通常需要输入这样的检索式:
接着数据库会出现文章含有偷税或逃税的案例和法条,布尔逻辑检索要求研究人员根据经验自己列出检索关键词,检索经验相当重要,需要根据出现的结果不断调整检索式,直到找到准确的检索结果。
第二种自然语言检索则简单地多,用户直接把一整段描述输入检索框中,例如直接输入如下内容:
数据库自动检索出相关结果,用户根据需要查看,选择任何认为最相关的内容,自然语言输入虽然简单,但是系统依然需要提取关键词进行检索,受到不相关的关键词干扰比较多,准确性也很难保证。
那么ROSS如何查询案例呢?
对比传统的自然语言检索,在检索式输入方式上,ROSS和传统的自然语言检索一样,用户只需要输入一段话,ROSS会自动反馈出结果。区别在于ROSS的基于的算法不同,传统的自然语言检索主要提取关键,分析关键词之间的在一篇文章的权重,找出相关的文献。ROSS则是首先理解问题,并把问题分解成成百上千个子问题,再去找每个问题的答案,然后对答案进行检索,寻找每个答案在数据库中的证据,相当于给每个答案进行证据打分,最后按照分值对每个答案排名,用户可以人工选择最优的答案,这样相当于对机器进行了一次培训,下次这个最优的答案在类似问题中就会排名靠前,这样系统会越来越准确。
可惜ROSS不能像律师助理一样能给这些案例做总结,也不能写个分析报告,给个明确的答案,呈现给用户的依然是数据库检索结果,只不过这个检索结果是通过人工智能检索的,而且系统可以随着使用次数的增多不断学习,结果会越来越准确。
比如你输入areoil and gas leases executory contracts?数据库中出现的结果如下图所示,这个结果不是ROSS总结的,实际上还是数据库中文档中的片段。(图片来源机器之心:独家对话RossIntelligence:第一个人工智能律师是如何炼成的)
总之,ROSS还是一款法律检索系统,其所能做的工作就是案例研究,甚至只能说是案例研究的检索工作的一部分,只是更高效地帮助用户检索出相关的案例。
二、机器人律师的工作(检索)效果如何?
针对ROSS的检索效果和效率,官方有相应的研究报告,我们不妨参考该报告的结果,研究小组寻找16个法律检索人员,分成四组,每组四人,分别用布尔逻辑、自然语言、ROSS和布尔逻辑、ROSS和自然语言进行检索,要求每组找出前二十个最相关的结果,最后的结果如下:
从上图可以看出利用ROSS加布尔逻辑检索比只用布尔逻辑准确率要提高很多,同时ROSS加自然语言检索也比只用自然语言检索效果明显。
此外,ROSS的用户体验也比其他检索方式好得多,这个很容易理解,布尔逻辑的检索结果很多噪声,去噪声很大程度上依赖检索人员的经验和技巧。自然语言输入中检索结果也会受到无关的关键词干扰
在节省检索时间上,ROSS无疑是突出的,ROSS整体能帮助检索人员节省大约26%的法律研究时间。
可见,ROSS在检索效率、准确率、用户体验上都要优于传统的法律数据检索系统,而且其效果会随着用户的训练越来越好。
三、机器人律师的影响如何?
人工智能能够大量节省律师的法律研究时间,但并不是人们想象中的能做很多律师的其他工作,即使在法律检索领域也需要人工挑选总结,而且需要大量的训练学习才能满足基本的准确率要求,目前主要是在破产法领域应用。
相信将来机器人律师会将合同审核、撰写等功能用上,某种程度会提高律师的工作效率,但取代律师的工作无从谈起,其工作还是建立在对文档的检索上,甚至对自然语言的基本上理解都难做到准确,更不用说法律术语背后的深刻含义,大量的推理、以及考虑诸如社会环境等众多因素,这些是智能检索系统无法做到的,但人工智能未来会不断进步,我们期待ROSS能在某一天通过司法考试,虽然它通过司法考试后还有很长一段路要走。目前已经不少律师事务所采用了ROSS系统,见下图: